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摘 要 : 全球 路 由 表 的 高 速 膨 朋 
路 由 表 , 很 多 研究 提出 了 新 的 路 由 


长 使 得 当前 的 互联 网 域 | 
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互 


的 路 由 解决 方案 分 为 短期 方案 、E 
类 工作 , 对 经 典 的 可 扩展 路 由 算法 和 路 


进行 了 总 结 和 展望 。 


关键 词 : 域 间 路 由 ， 可 扩展 性 ; 


展 路 


路 由 系统 的 可 扩展 性 面临 着 严峻 的 挑战 ,为 了 缩减 


解决 方案 。 本 文 在 介绍 了 互联 网 路 由 


架构 


如 今 ， 互 联网 域 间 路 1 


展 性 正面 


恶化 
恶化 。 


为 了 应 对 路 由 表 的 脱 胀 ， 网 络 服务 提 


、 压 缩 路 由 表 数 据 结构 ; 


中 


pe 


研究 方向 。 


1 背景 :互联 网 路 由 系统 现状 


| 对 互联 网 路 由 扩 


思想 和 特点 ,3 


算法 三 部 分 ， 着 习 
架构 进行 了 分 析 和 比较 , 最 后 对 


t 商 (ISP) 采 取 了 以 下 措施 : 
三 、 过 滤 IP 前 级 。 但 是 升级 路 由 器 硬件 提高 了 网 络 服务 提供 商 
的 经 营 成 本 ,降低 了 网 络 的 性 价 比 ,而 高 端 路 由 器 的 性 能 发 展 能 否 跟 上 路 由 表 的 膨胀 速度 还 
是 一 个 问题 。 压 缩 路 由 表 的 数据 结构 会 引起 更 多 的 计算 代价 ， 不 利 了 
滤 IP 前 级 将 导致 一 些 站 点 不 可 达 。 这 些 措施 都 没有 触及 根本 问题 。 
根本 上 解决 路 由 扩展 问题 ， 修 改 边 界 网 关 
新 的 路 由 架构 十 分 必要 趾 。 为 此 ， 近 年 来 他 
从 不 同 技术 角度 对 可 扩展 的 互联 网 路 由 进行 了 探讨 , 提 HH 
工作 进行 了 综述 , 分 析 和 比较 了 它们 的 基 


上 了 很 多 路 | 


系统 现状 之 后 , 从 较 高 层次 上 将 存在 
讨论 了 路 由 算法 和 路 由 架构 这 两 
尚未 解决 的 问题 和 未 来 的 研究 方向 


甸 着 十 分 严峻 的 挑战 站。 据 统 计 ， 基 于 IPv4 
的 全 球 路 由 表 (global routing table) 表 项 数目 前 已 在 30 万 以 上 ， 且 还 在 呈现 指数 级 增长 站。 庞 


大 的 路 由 表 显 著 增 加 了 路 由 器 的 内 存 和 处 理 器 开销 , 导致 通 信 延 时 的 增长 和 路 由 收敛 属性 的 


一 、 升 级 路 由 器 硬件 ; 


F 路 由 器 的 快速 反应 ; 过 
许多 专家 认为 ， 为 了 从 
协议 〈Border Gateway Protocol, BGP) 甚至 建立 全 


展 问题 的 


究 掀 起 了 一 个 热潮 ， 


解决 方案 。 本 文 对 这 些 


引出 了 有 待 解决 的 问题 和 未 来 的 


互联 网 是 由 许多 自治 系统 (Autonomous System，AS) 连 接 而 成 的 。 
主 决定 在 内 部 如 何 选择 路 由 。 网 络 运营 商 通 常 对 自治 系统 内 部 的 链 路 分 配 代价 , 然后 沿 链 路 


代价 之 和 最 小 的 路 径 转发 流量 。 这 类 路 


个 自治 系统 可 以 自 


| 选择 协议 有 OSPF!、IS-IS* 等 。 对 于 较 大 的 自治 系 


统 ， 它 的 网 络 通 常 被 分 为 若干 个 路 由 区 域 以 便 降低 路 由 复杂 性 和 提高 路 由 扩展 性 。 


在 自治 系统 之 间 唯 一 使 用 的 路 由 协议 是 BGP 协议 ,每 个 BGP 路 由 器 会 告诉 它 的 邻居 哪 
些 目 的 地 址 前 级 标识 的 站 点 通过 它 的 网 络 可 达 以 及 需要 穿越 的 自治 系统 路 径 。 因 此 ，BGP 


协议 是 基于 路 径 向 量 的 。 寿 


E 互 联网 的 边缘 网 络 


对 目的 地 未 知 的 包 使 用 缺 省 路 


量 的 增加 而 膨胀 。 


1 即 *“Open Shortest Path First”, 


发 送 。 然 而 在 互联 网 的 核心 


:一 个 内 部 网 关 协 议 


，BGP 路 由 器 维护 的 路 由 表 项 数 相 对 较 少 ， 
区 域 ，BGP 路 由 器 并 不 存在 缺 
省 路 由 ， 因 此 该 区 域 又 被 称 为 互联 网 的 无 缺 省 区 (default-free zone，DFZ)。 无 缺 省 区 路 由 器 
常常 需要 为 互联 网 的 每 个 可 达 的 IP 前 级 安装 一 条 路 由 , 结果 导致 路 


| 表 随 着 全 球 IP 前 级 数 


”Intermediate system to intermediate system， 中 间 系 统 到 中 间 系 统 。 一 种 内 部 网 关 协 议 
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互联 网 域 间 路 由 的 扩展 问题 早 就 存在 。IETF 在 上 世纪 90 年 代 采 用 无 类 别 域 间 路 由 “一 
度 有 效 地 降低 了 全 球 路 由 表 的 膛 胀 速度 。 然 而 ,近年 来 各 种 反 聚 合 因素 的 增长 使 得 无 类 别 域 
间 路 由 的 路 由 聚合 作用 逐渐 失效 ，IPv4 前 组 数量 迅速 增加 ， 无 缺 省 区 的 路 由 表 再 度 呈 现 爆 
炸 式 增长 。 根 据 互联 网 架构 委员 会 (IAB) 在 2007 年 的 报告 中 ， 这 些 因素 主要 包括 : 


1. 与 提供 商 无 关 的 地 址 


客户 网 络 倾 向 于 使 用 与 提供 商 无 关 (provider-independent，PT) 的 地 址 ， 这 样 在 改变 提供 
时 可 以 避免 重 编号 Cenumbering) 一 一 对 网 络 设备 和 主机 重新 分 配 IP 地 址 。 因 为 现实 中 重 
号 往往 要 花费 很 高 的 代价 。PI 前 绥 由 于 不 能 被 上 级 提供 商 聚 合 ， 必 须 登 记 到 无 缺 省 区 的 
路 由 表 中 。 增 加 的 地 址 前 级 不 需要 客户 付费 ， 然 而 无 缺 省 区 路 由 表 将 因此 而 膨胀 。 


2. 多 宿主 


多 宿主 (multi-homing) 是 指 一 个 站 点 从 多 个 提供 商 那 里 获得 服务 。 多 窒 主 得 到 广泛 应 用 
的 原因 在 于 : 提供 了 备用 路 由 ， 能 够 增加 连接 到 互联 网 的 可 靠 性 。 一 个 多 宿主 的 站 点 可 以 使 
用 PI 地 址 或 PA(provider-aggregatable)”? 地 址 。 如 果 使 用 PI 地 址 ， 那 么 PI 前 缀 必须 出 现在 它 
的 所 有 提供 商 的 路 由 表 中 。 如 果 使 用 PA 地 址 ， 那 么 PA 前 级 仅 能 够 被 分 配 该 地 址 的 提供 商 
聚合 , 但 是 不 能 被 其 它 提供 商 聚 合 。 实 际 上 ,由 于 最 长 前 缀 匹配 规则 的 存在 ,为 了 保证 PA 前 
级 可 以 经 过 它 的 提供 商 可 达 , 往往 该 提供 商 也 需要 单独 发 布 该 前 级 。 因 此 不 管 哪 一 种 情况 都 
将 导致 前 级 聚合 失效 。 


3. 流量 工程 


流量 工程 (traffic engineering, TE) 的 目的 是 让 某 些 互联 网 流量 避免 使 用 特定 的 网 络 路 径 。 
使 用 流量 工程 的 既 包 括 提供 商 网 络 也 包括 客户 网 络 , 具体 原因 有 负载 平衡 、 降 低 费用 和 安全 
需求 等 。 在 BGP 级 ， 如 果 要 对 某 块 地 址 实施 流量 工程 ， 那 么 网 络 运 营 商 必须 将 该 地 址 前 级 
从 原来 的 较 短 前 缀 中 分 裂 出 来 单独 发 布 到 全 球 路 由 表 中 。 

上 述 因素 使 得 IPv4 前 缀 不 断 分 裂 ， 全 球 路 由 表 中 的 前 级 粒度 越 来 越 细 ， 数量 越 来 越 多 。 
尽管 全 球 路 由 表 的 规模 受到 IPv4 的 地 址 空间 的 约束 ， 但 是 这 并 不 意味 着 路 由 表 的 膨胀 速度 
和 会 减缓 。 随 着 IPv6 的 广泛 部 署 和 应 用 ， 由 于 IPv6 能 够 提供 庞大 的 地 址 空间 ， 可 能 导致 全 球 
路 由 表 项 数 以 更 快 的 速度 增长 。 基 于 以 上 因素 , 很 多 专家 认为 ， 提 高 互联 网 路 由 系统 的 扩展 
9 性 已 经 迫在眉睫 。 


2 互联 网 可 扩展 路 由 研究 分 类 


为 了 降低 路 由 表 规 模 和 解决 互联 网 路 由 的 扩展 问题 , 目前 已 经 提出 了 许多 解决 方案 。 根 
据 着 眼 点 的 不 同 这 些 解决 方案 从 较 高 层次 上 可 以 分 为 三 类 。 
1. 短期 方 和 


短期 方案 大 多 是 对 BGP 协议 提出 增 量 式 的 修改 , 并 且 以 提高 BGP 路 由 的 收敛 属性 和 降 
低 时 延 为 主 。Forgetful routings 外 可 以 降低 路 由 表 所 占用 的 内 存 空 间 。 它 的 基本 思想 是 选择 


或 型 


3 Internet Engineering Task Force， 互 联网 工程 任务 组 

4 Classless Inter-Domain Routing，CIDR。 一 个 用 于 给 用 户 分 配 IP 地 址 以 及 在 互联 网 上 有 效 地 路 由 IP 数据 
包 的 对 了 P 地 址 进行 归 类 的 方法 

”可 由 提供 商 聚 合 的 地 址 

5 有 译 成 “健忘 路 由 ” 
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性 地 丢弃 路 由 表 中 的 部 分 替代 路 由 ， 只 有 在 必要 时 才 从 邻接 路 由 器 那里 获取 。 它 不 需要 改变 
BGP 协议 且 基 本 不 影响 路 由 的 收敛 属性 。 但 是 Forgetful routing 并 没有 减少 IP 前 级 数量 和 路 
表 的 增长 速度 ， 因 此 是 一 个 短期 方案 。 考虑 到 短期 方案 并 不 能 真正 提高 路 由 扩展 性 ， 本 文 
中 不 作 有 具体 讨论 。 


2. 路 由 架构 


从 中 长 期 来 解决 路 由 扩展 性 的 目标 出 发 , 很 多 研究 人 员 提 出 了 新 的 路 由 架构 ,其 中 许多 
是 IRTF ”四 的 提案 。 绝 大 多 数 的 新 路 由 架构 都 是 考虑 在 现 有 域 间 路 由 系统 中 增加 一 个 间接 的 
中 间 层 (indirection layer)， 使 域 间 的 遍 平 路 由 架构 变 成 分 层 的 。 中 间 层 将 IP 地 址 空间 分 离 为 
主机 标识 和 路 由 标识 两 部 分 ， 后 者 在 路 由 时 作为 位 置 符 使 用 ， 并 建立 它们 之 间 的 映射 ; 或 者 
更 激进 一 些 ， 中 间 层 可 能 引入 一 种 新 的 名 字 空 间作 为 路 由 标识 空间 ， 将 IP 地 址 空间 映射 到 
该 名 字 空 间 。 包 在 传递 过 程 中 由 中 间 层 在 某 个 阶段 将 主机 标识 用 路 由 标识 蔡 换 来 穿越 互联 
网 。 路 由 标识 要 么 是 能 够 聚合 的 ， 要 么 具有 较 大 的 粒度 ， 使 得 路 由 标识 的 数量 是 可 控 的 ， 从 
而 缩减 路 由 表 。 


这 基于 路 由 标识 的 类 型 和 来 源 ， 可 以 将 新 的 路 由 架构 分 成 核心 -边缘 分 离 、 位 置 符 / 标 识 符 
> 分 离 、 基 于 自治 系统 号 的 路 由 、 基 于 虚拟 聚合 对 象 的 路 由 等 ; 根据 路 由 架构 以 改变 主机 为 主 
还 是 以 改变 网 络 为 主 可 以 分 为 基于 主机 的 和 基于 网 络 的 ; 而 根据 包 传递 过 程 中 使 用 路 由 标识 
替换 主机 标识 时 是 改写 包 地 址 还 是 对 包 进 行 封 装 ， 可 以 将 新 路 由 架构 分 为 地 址 重 写 (address 
已 rewriting) 的 和 映射 与 封装 的 (map & encapsulation)。 


3. 可 扩展 路 由 算法 


可 扩展 路 由 算法 研究 旨 在 降低 网 络 节点 维护 的 状态 数量 和 控制 开销 , 立足 于 从 根本 上 来 
© 解决 路 由 扩展 问题 。 针 对 互联 网 的 可 扩展 路 由 算法 研究 一 直 没 有 停止 过 。 最 早 是 克 兰 洛克 ( 工 . 
GN Kleinrock) 和 卡 蒙 (F. Kamoun) 多 提出 的 基于 分 区 的 层次 化 路 由 算法 。 它 在 互联 网 上 得 到 
~> 了 广泛 应 用 ， 如 划分 自治 系统 ， 以 及 OSPF、IS-IS 等 支持 分 区 的 域内 路 由 协议 。 而 BGP 协 
议 采 用 的 路 由 算法 是 基于 路 径 向 量 的 ， 本 质 上 不 具备 良好 的 扩展 性 。 到 目前 为 止 ,已 存在 很 
多 种 可 扩展 路 由 算法 ， 如 不 同类 型 的 层次 化 路 由 、 地 理 路 由 、 紧 次 路 由 、 分 布 式 哈 希 表 路 由 
一 等 等 。 这 些 路 由 算法 有 的 被 互联 网 路 由 系统 所 接受 ， 如 基于 提供 商 的 层次 化 路 由 ， 更 多 的 还 
全 停留 在 理论 层面 上 ， 作 为 互联 网 长 期 可 扩展 的 新 型 路 由 方案 的 探索 。 


瑞 格 特 〈Yakov Rekhter) 有 一 名 名言:“ 要 么 编 址 服从 拓扑 ， 要 么 拓扑 服从 编 址 ， 二 者 
必 居 其 一 (Addressing can follow topology or topology can follow addressing, choose one)。” 这 
一 针对 路 由 扩展 性 的 基本 假设 被 称 为 Rekhter 定律 。 针 对 互联 网 的 可 扩展 路 由 研究 大 都 是 试 
图 重新 将 互联 网 路 由 扳 回 到 遵循 该 定律 的 轨道 上 来 。 


3 ”可 扩展 路 由 研究 成 果 分 析 


3.1 可 扩展 路 由 算法 


传统 的 最 短路 径路 由 算法 ,如 距离 向 量 、 链 路 状态 和 路 径 向 量 等 算法 ， 在 每 个 节点 上 要 
维护 到 所 有 节点 的 路 由 信息 ， 因 此 路 由 表 项 数 为 O(n)， 其 中 n 是 节点 总 数 。 此 时 路 由 表 占 
用 的 内 存 和 维护 路 由 表 的 控制 开销 都 随 网 络 规模 快速 增长 ,因此 扩展 性 不 好 。 可 扩展 路 由 算 
法 由 在 降低 路 由 表 的 内 存 开销 和 控制 消息 开销 。 下面 分 类 介绍 已 知 的 一 些 经 典 的 可 扩展 路 由 


也 | 
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互联 网 可 扩展 


2 
异 


算法 。 


3.1.1 基于 分 区 的 层次 化 路 由 


基于 分 区 的 层次 化 路 由 (area hierarchical 
routing) 的 基本 思想 是 : 对 网 络 骨 套 地 划分 区 域 
并 隔离 不 同 区 域 的 拓扑 更 新 ， 每 个 节点 对 自己 
维护 的 路 由 信息 采用 “上 距离 越 近 越 详细 ”的 策 
略 ， 较 远 的 区 域 信息 尽量 简略 。 基 于 分 区 的 层 
次 化 路 由 是 由 克 兰 洛克 和 卡 蒙 外 最 早 提出 的 ， 
也 称 基于 分 复 的 层次 化 路 由 (cluster hierarchi- 
cal routing)。 这 一 路 由 方式 可 以 使 节点 的 路 由 表 
项 数 缩减 至 in ， 其 中 n 是 节点 总 数 ，k 是 分 


区 的 级 数 。 
下 面 简单 介绍 这 种 路 由 的 基本 设计 。 图 1 。 四 分 区 的 3 级 层次 位 % 


mk | 


给 出 了 一 个 具有 3 级 的 层次 化 网 络 的 例子 。 图 | 旧 的 地 | 下 一 刺 跑 数 | 
2 则 示 出 了 图 1 中 节点 3.2.1 所 能 见 到 的 网 络 视 1 3.1.1 | 2 
图 和 路 由 表 设置 。 节点 3.2.1 的 路 由 表 项 数 总 共 2 3.2.2 | 1 
为 6( 而 如 果 不 划 分 区 域 ,需要 24 项 ， 等 于 网 络 31 | 3.11 | 1 
节点 总 数 )。 3.2.1 | 一 一 | 0 
3.2.2 | 3.22 | 1 
基于 分 区 的 层次 化 路 由 思想 在 互联 网 上 得 323 | 323 | 1 


到 了 广泛 研究 和 应 用 。 例 如 ， 互 联网 划分 为 不 图 2. 节点 3.2.1 的 网 络 视图 和 路 由 表 项 
同 的 自治 系统 ， 使 用 域 间 域内 两 级 的 路 由 

结构 ， 并 且 在 域内 ，OSPF 和 IS-IS 协议 也 是 分 区 的 。 针 对 域 间 路 由 ， 最 近 的 一 些 研究 也 提 
出 了 分 区 的 层次 化 路 由 架构 吕 。 


3.1.2 基于 地 标的 层次 化 路 由 


基于 地 标的 层次 化 路 由 (landmark hierarchi- 
cal routing) 是 对 基于 分 区 的 层次 化 路 由 的 改编 ， 
以 使 层次 结构 更 易于 动态 管理 。 它 最 早 是 由 土屋 
(Paul Tsuchiya) 提出 的 ， 基 本 思想 是 ， 迭代 
地 选择 网 络 中 的 节点 作为 地 标 并 构建 层次 结构 ， 

每 个 节点 只 存放 到 本 地 节点 和 若干 地 标的 路 
言 县 ; 路 由 时 对 目的 地 不 在 路 由 表 中 的 消息 朝 离 
目的 节点 最 近 的 地 标 发 送 , 然后 由 地 标 转发 给 目 


这 类 路 由 的 一 个 重要 概念 就 是 地 标 。 一 个 地 
标 是 从 网 络 中 选择 的 一 个 节点 。 设 该 地 标的 管辖 
半径 为 r， 那 么 可 以 将 与 它 的 距离 不 超过 r 的 那 
些 节 点 的 集合 看 成 是 它 的 邻 域 ， 邻 域 中 的 每 个 节点 都 包含 到 该 地 标的 路 由 信息 。 值 得 注意 的 
是 ， 地 标的 路 由 表 可 以 不 需要 维护 到 邻 域 中 节点 的 路 由 信息 。 图 3 展示 了 一 个 基于 地 标的 3 
级 层次 化 网 络 ， 其 中 所 有 节点 都 是 第 0 级 地 标 , 用 两 个 圆 环 表示 的 节点 是 从 第 0 级 地 标 中 选 
出 的 第 1 级 地 标 ， 用 三 个 圆 环 表示 的 节点 是 从 第 1 级 地 标 中 选 出 的 第 2 级 地 标 。 


图 3. 基于 地 标的 3 级 层次 化 网 络 
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基于 地 标的 层次 化 路 


基于 地 标的 层次 化 路 
径 质量 得 到 了 提高 。1 


Technology Letter 


可 以 大 幅 缩减 节点 的 路 由 表 
可 以 克服 基于 分 区 的 
具有 相对 较 好 的 动态 管理 特 


一 些 拓扑 变化 较 快 的 网 络 ， 如 无 线 自 组 织 网 络 。 


3.1.3 基于 提供 商 的 层次 化 路 由 
基于 提供 商 的 层次 化 路 由 


(provider hierarchical routing) 是 目 
前 互联 网 唯一 使 用 的 域 间 可 扩展 
路 由 机 制 ,无 类 别 域 间 路 由 的 地 址 
聚合 就 是 以 该 方法 为 基础 的 ,基于 
提供 商 的 层次 化 路 由 的 基本 思想 
是 利用 域 间 存在 的 提供 商 -客户 
(provider-customer) 层 次 结构 对 客 
户 网 络 分 配 可 由 提供 商 聚 合 的 IP 
地 址 (PA 地 址 )。 


图 4 展示 了 互联 网 的 基于 提 
供 商 的 层次 结构 。 用 户 域 (Stub) 


必须 连接 到 一 个 提供 商 域 来 获取 转发 (transit) 朋 


图 4. 基于 提供 商 的 互联 网 层次 结构 
有 务 。 而 本 地 级 或 地 区 级 提供 商 必须 连接 到 骨 


骨干 
提供 商 1 


典型 


» wb 


骨干 
提供 商 2 
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情况 可 以 缩减 至 O(Vn) 色 。 
层次 化 路 由 存在 的 边界 效应 , 邻近 节点 之 间 的 路 
性 , 基于 地 标的 层次 化 路 由 比较 适用 于 


用 户 - 提 供 商 通路 


干 提供 商 来 获取 转发 服务 。 互 联网 的 层次 结构 并 不 是 树 状 的 ,一 个 域 可 以 连接 到 多 个 提供 商 ， 


这 种 情况 称 为 多 宿主 。 并 且 两 个 域 之 间 还 可 以 建立 对 
供 穿越 服务 ， 如 地 区 提供 商 2 和 地 区 提供 商 3。 
连 ; 如 地 区 提供 商 1。 因此 ， 一 个 域 可 能 有 


个 域 甚 至 可 


以 直接 与 不 同 


等 传输 (peer to peer) 关系 ， 以 互相 提 
层次 的 提供 商 相 


不 同 


个 客户 网 络 改 变 了 它 的 提供 商 , 那么 它 应 当 从 其 新 提 
给 以 前 的 提供 商 ， 该 过 程 称 为 重 编号 。 


网 络 重 编号 需要 很 高 的 代价 。 


并 且 使 用 可 


供 商 那 旦 


| 提供 商 聚 合 


和 癌 有 各 全 


EE 获得 地 址 ， 并; 


的 提供 商 分 配 的 多 个 地 址 前 级 。 如 果 一 
各 原来 的 地 址 还 


(PA) 地 址 也 将 阻碍 多 宿主 、 


主机 移动 和 流量 工程 的 应 用 。 因 此 客户 网 络 越 来 越 倾向 于 使 用 与 提供 商 无 关 (PI) 地 址 ， 而 


不 是 可 由 提供 商 聚 合 地 址 。 这 些 使 得 基于 提供 商 的 层次 化 路 由 在 互联 网 


由 表 膨胀 。 
3.1.4 分 布 式 哈 希 表 路 由 
分 布 式 哈 希 


表 (Distributed Hash Table，DHT) 技 术 在 网 络 上 构建 了 一 种 键 一 值 


FEF 失效 ,从 而 导致 路 


(key-value) 


种 则 和 辑 网 络 是 根据 节点 的 标识 度量 


为 止 ， 分 布 式 哈 希 表 主 要 用 于 在 网 络 层 之 上 构建 逻辑 


环 路 ! 


方法 (Virtual Ring Routing，VRR)。 虚 拟 环 路 
要 保证 标识 唯一 即 可 。 基 本 思想 是 : 


网 络 上 直 


目的 节点 的 路 | 


查询 服务 。 节 点 和 键 共用 一 个 特定 的 标识 空间 。 假定 键 对 应 的 值 存放 在 标识 与 键 相等 的 节点 
FE， 从 一 个 节点 上 根据 键 查 找 值 的 过 程 等 同 于 从 该 节点 到 相应 


过 程 。 到 目前 


网 络 ， 前 提 是 存 如 
空间 来 构建 的 , 节点 之 间 的 逻辑 距离 可 以 1 
算出 。 每 个 节点 将 收 到 的 消息 转发 给 离 目 的 节点 “距离 
点 。 分 布 式 哈 希 表 网 络 通常 具有 比较 规则 的 拓扑 结构 


凯撒 (M. Caesar) 等 人 中 考虑 了 在 物理 


E 网 络 层 路 由 协议 。 这 
它们 的 标识 扒 
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离 ” 最 近 的 邻居 ， 从 而 逐步 逼近 目的 节 
， 如 环 状 路 、 树 状 等 。 


接 构建 分 布 式 哈 希 表 ， 提 出 了 一 种 虚拟 
使 用 不 包含 语义 的 局 平 标 识 路 由 ， 只 


将 所 有 节点 根据 它们 的 标识 顺序 组 织 成 一 个 虚拟 环 ， 利 


互联 网 可 扩展 


后 如 


各 由 研究 


用 类 似 于 Chords 四 的 机 制 来 贪心 地 转发 消息 。 虚 拟 环 路 由 方法 在 多 种 类 型 的 网 络 上 的 应 用 
都 得 到 了 研究 ， 如 无 线 自 组 织 网 络 、 企 业 局 域 网 和 互联 网 等 。 


ROFL? 0 是 一 种 基于 虚拟 环 路 由 的 面向 互联 网 的 可 扩展 路 由 算法 。ROFL 在 网 络 层 消 
除了 位 置 符 ， 完 全 使 用 与 位 置 无 关 的 标识 进行 路 由 。 该 方法 继承 了 位 置 符 /标识 符 分 离 的 诸 
多 优点 ， 如 移动 性 、 多 宿主 和 标识 稳定 等 ,但 是 不 需要 引入 映射 系统 ， 编 址 和 路 由 显得 更 加 
简单 。ROFL 的 基本 原理 是 在 网 络 层 将 主机 和 路 由 器 标识 组 织 成 层次 化 的 分 布 式 哈 希 表 ， 同 
时 支持 基本 的 域 间 路 由 策略 。 


ROFL 能 够 大 幅 缩 减 路 由 表 规 模 ,仿真 表明 在 6x10 个 ID 的 网 络 中 ， 平 均 情况 下 路 由 表 
规模 仅 为 10” 的 数量 级 。 但 是 ROFL 使 用 的 路 径 与 最 短路 径 相 比 长 度 显 著 增 加 ， 表明 在 路 径 
质量 上 还 不 太 理想 。 


3.1.5 紧凑 路 由 


紧凑 路 由 (compact routing) 是 一 类 在 理论 上 保证 同时 具有 较 小 路 由 表 和 较 低 拉 伸 系数 的 
路 由 算法 。 紧凑 路 由 使 每 个 节点 的 路 由 表 规 模 为 O(n), 即 随 节 点 总 数 n 呈 亚 线 性 增长 ,因此 保 
> 证 了 路 由 表 的 可 扩展 性 。 它 的 基本 思想 是 平衡 路 由 表 大 小 和 路 径 长 度 ,， 允许 有 限 的 路 径 拉 伸 
- 来 大 幅 缩减 路 由 表 。 


针对 通用 图 的 紧凑 路 由 研究 目前 已 取得 接近 最 优 的 成 果 册 站。 但 是 真实 的 网 络 往 往 呈 现 
特定 的 拓扑 结构 特征 。 通 用 的 紧凑 路 由 算法 因为 没有 利用 拓扑 特征 在 实际 网 络 上 可 能 并 不 是 
最 优 的 。 研 究 人 员 常 常用 特定 结构 的 图 来 为 真实 的 网 络 建 模 ， 如 露 律 图 (power-law graph)、 
增长 受 限 的 图 (growth-bounded graph)、 平 面 图 等 。 


将 紧凑 路 由 用 于 互联 网 域 间 的 设想 始 于 克 留 科 夫 (D. Krioukov) 等 人 中 ,他 们 使 用 TZ 
算法 在 肾 律 图 和 真实 的 互联 网 自治 系统 图 上 进行 了 仿真 ， 发 现 平 均 的 路 由 表 项 数 很 小 ， 而 平 
均 拉 伸 度 约 为 1.1.。 此 后 ， 针 对 类 互联 网 拓扑 结构 的 图 上 的 紧 凌 路 由 开始 得 到 更 多 关注 。 文 
献 [14-16] 等 利用 了 无 标 度 特征 来 设计 紧凑 路 由 算法 , 被 证 明 比 TZ 算法 在 类 互联 网 的 网 络 上 
具有 更 高 的 性 能 。 文 献 [17] 对 紧凑 路 由 和 在 互联 网 上 的 应 用 问题 进行 了 综述 。 


一 3.1.6 地 理 路 由 


OO 地 理 路 由 (geographical routing) 是 指 基 于 节点 的 地 理 位 置 使 用 贪心 路 由 ,一 个 节点 通常 只 
需要 维护 自己 和 邻居 的 地 理 位 置 , 收 到 消息 时 选择 在 地 理 位 置 上 离 目 的 节点 最 近 的 邻居 作为 
下 一 跳 。 地 理 路 由 有 可 能 陷入 局 部 最 小 点 (local minimum) 一 一 找 不 到 比 自己 离 目的 节点 更 近 
的 邻居 ， 因 此 贪心 路 由 失效 。 解 决 该 问题 的 常用 办 法 是 使 用 基于 拓扑 的 奉 代 路 由 方案 ， 如 面 
路 由 时 等 。 一 旦 贪心 路 由 遇 到 局 部 最 小 点 时 ， 启 用 符 代 路 由 方案 来 跳出 局 部 最 小 点 ， 然 后 
再 恢复 贪心 路 由 。 


地 理 路 由 可 以 在 每 个 节点 上 使 用 很 小 的 路 由 表 ， 几 乎 不 需要 维护 网 络 的 拓扑 信息 ， 因 此 
具有 十 分 理想 的 可 扩展 性 。 地 理 路 由 在 互联 网 和 无 线 网 络 领域 都 得 到 了 广泛 研究 。 文 献 [19] 
较 早 提出 了 在 互联 网 上 如 何 使 用 地 理 信 息 编 址 和 路 由 , 并 与 基于 提供 商 的 路 由 方案 进行 了 比 
较 ; 文献 [20] 针 对 IPv6 提出 了 使 用 基于 地 理 位 置 的 编 址 方案 ; 文献 [21] 则 考虑 了 在 包 首 部 中 
携带 地 理 信息 来 辅助 互联 网 路 由 。 


上 


”一 个 分 布 式 查 找 协 议 
?Routing on flat labels， 一 种 完全 基于 平面 标签 的 新 颖 路 由 方式 
1 Thorup-Zwick 
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为 了 保证 较 高 的 路 由 成 功率 和 较 低 的 拉 伸 度 , 地 理 路 由 要 求 网 络 连接 密度 尽 可 能 高 ， 即 


要 求 地 理 位 置 靠近 的 节点 在 拓扑 上 也 是 邻近 的 ， 最 好 是 直接 互 连 的 。 然而， 真实 网 络 可 能 难 
以 满足 上 述 条 件 。 特别 是 在 互联 网 环境 中 ,自治 系统 之 间 的 连接 关系 是 由 它们 之 间 的 利益 决 
定 的 ， 
在 问题 。 


3.1.7 图 供 入 路 由 


因此 相 邻 地 区 的 自治 系统 并 不 一 定 是 互 连 的 ; 况且 地 理 路 由 在 支持 流量 工程 方面 还 存 


图 符 入 (graph embedding) 的 基本 思想 是 : 对 网 络 中 的 每 个 节点 分 配 虚拟 坐标 ， 将 节点 映 


射 到 虚拟 几何 空间 或 隐藏 度量 空间 中 的 点 ， 简 化 节点 之 间 的 “距离 ”计算 。 通 过 图 和 代入 ， 路 


由 算法 也 可 以 使 月 


贪心 路 由 ， 每 个 节点 具 需 要 知道 邻居 的 坐标 , 在 转发 消息 时 总 是 选择 与 目 


的 节点 “距离 ”最 近 的 邻居 转发 ， 这 一 点 与 地 理 路 由 相似 。 但 是 与 地 理 路 由 方法 不 同 ， 虚 拟 


坐标 的 构造 不 需要 感知 节点 的 物理 位 置 ， 
是 虚拟 坐标 能 够 反映 网 络 的 连通 信息 , 在 很 多 情况 下 能 够 提高 路 由 的 性 能 。 缺 点 是 当 网 络 的 


而 是 通常 基于 网 络 的 拓扑 信息 构造 。 这 样 做 的 优点 


拓扑 改变 时 ， 至 少 一 部 分 节点 的 虚拟 坐标 也 要 随 之 更 新 ， 因 此 动态 属性 不 如 地 理 路 由 。 


基于 图 嵌入 的 路 由 研究 目前 大 多 针对 无 线 网 络 呈 六 ,但 是 可 以 为 未 来 的 互联 网 路 由 设计 


提供 启发 。 克 留 科 夫 等 人 "认为 基于 复杂 网 络 的 隐藏 度量 空间 的 贪心 路 由 有 可 能 为 互联 网 
提供 一 种 理想 的 路 由 方法 。 [25] 提 出 了 利用 一 种 双 曲 空间 来 构造 类 互联 网 的 无 标 度 网 络 的 


方法 ， 发 现 基于 该 双 
到 | 


3.2 路 由 架构 


为 了 克服 现 有 域 间 路 由 架构 的 不 足 
IRTF 的 提案 。 这 些 路 由 架构 依据 基本 特 


不 是 严格 的 划分 ， 一 种 路 由 架构 可 能 章 


3.2.1 基于 自治 系统 号 的 路 由 


不 是 IP 前 级 来 进行 路 由 。 这 样 ， 核 心路 由 表 的 表 项 数 最 多 等 于 自治 系统 的 总 数 。 由 于 自治 
系统 总 数目 前 比 卫 前 级 总 数 少 一 个 数量 
个 代表 是 HLP* "。HLP 还 利 月 


于 自治 系统 具有 比 IP 前 级 更 大 的 


| 空间 的 贪心 路 由 具有 较为 理想 的 性 能 。[26] 提 出 了 将 无 标 度 网 络 腊 入 
它 的 骨架 导出 的 度量 空间 的 方法 ， 分 析 表 明基 于 该 度量 空间 的 贪心 路 由 其 有 高 扩展 性 。 


,很 多 研究 提出 了 新 的 域 间 路 由 架构 ， 其 中 许多 
点 可 以 分 为 成 下 面 儿 类 。 值 得 注意 的 是 ， 该 分 类 并 


有 多 种 特点 ， 因 此 亦 可 属于 不 同类 别 。 


粒度 ， 因 此 一 些 研究 提出 在 域 间 基于 自治 系统 号 而 


级 ， 因 此 可 以 大 幅 缩减 路 由 表 规 模 。 这 类 工作 的 一 


日 了 划分 区 域 的 分 级 路 由 思想 。 它 根据 服务 提供 商 - 客 户 
(provider-customer) 的 层次 关系 将 域 间 网 络 划 分 成 树 状 区 域 ， 把 不 同 的 区 域 隔离 ， 将 路 由 


更 


经 远离 树 状 结构 ， 划 分 树 状 
们 之 间 的 连接 关系 ， 这 在 目前 也 是 不 太 可 行 的 。 


同 


新 和 故障 限制 在 本 区 域内 。HLP 使 


原子 路 由 〈Atomized routing) [9 


自治 系统 路 径 的 长 IP 前 级 ， 在 一 定 程 


了 链 路 状态 和 路 径 向 量 两 种 路 由 协议 来 提高 域 间 E 
1 的 收敛 属性 。 但 是 域 间 网 络 拓扑 由 于 多 宿主 和 对 等 操作 (peering) “连接 的 广泛 使 用 ,已 
区 域 在 效果 上 并 不 理想 。 而 且 HLP 要 求 网 络 服务 提供 商 公 开 它 


引入 了 一 种 称 为 “原子 ”的 对 象 ， 聚 合 那些 拥有 相 
度 上 也 可 以 看 成 是 基于 自治 系统 号 的 路 由 。 原 子路 


由 被 设计 用 于 边缘 的 客户 网 络 , 即 被 通告 的 原子 来 自 于 客户 网 络 , 在 核心 网 络 中 根据 原子 标 
识 或 IP 前 组 进行 路 由 。 通 过 用 原子 标识 聚集 长 卫 前 级 ， 使 核心 路 由 表 规 模 得 到 了 缩减 。 


基于 自治 系统 号 的 路 由 必须 构建 和 维护 IP 前 级 到 自治 系统 号 的 映射 表 ， 并 提供 查询 。 
从 长 期 来 看 , 这 类 路 由 架构 的 路 由 扩展 性 仍然 受到 较 强 的 限制 。 这 是 因为 近年 来 分 配 的 自治 


”网络 服 务 商 之 间 的 一 种 数据 流 流通 安排 :在 两 个 服务 商 之 间 交 换 路 由 通告 ， 以 确保 来 自 第 一 个 服务 商 的 


业 


务 能 


够 到 达 第 二 个 服务 商 的 客户 ， 反 之 亦 然 。 
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互联 网 可 打 属 


系统 号 的 增长 速度 比 卫 前 级 数量 增长 更 快 , 从 2000 年 的 10000 个 左右 迅速 增加 到 目 


50000 个 中， 自治 系统 号 
得 不 到 有 效 控制 。 


3.2.2 基于 虚拟 聚集 对 象 的 路 由 


这 类 路 


Ft 


在于 分 
九 


ra 
mm 
2 


目前 已 从 16 位 升级 到 32 位 。 照 此 趋势 ， 全 球 路 由 


架构 也 是 基于 比 IP 前 级 更 大 的 拓扑 粒度 来 路 由 。 基 本 思想 是 使 朋 


前 的 近 


表 的 增长 速度 仍 


日 虚拟 聚集 对 


象 来 聚集 较 长 的 IP 前 绥 ， 在 核心 网 络 中 使 用 虚拟 聚集 对 象 的 标识 来 路 由 。 这 类 工作 主要 有 


CRIOPC9、ISLAYEB0I 等 。 


CRIO 使 用 一 种 虚拟 IP 前 级 对 实际 的 IP 前 级 进行 聚合 。 
(aggregation proxy)。 
长 的 IP 前 级 。 聚 合 代 理 向 其 它 核 心路 由 器 发 布 自己 的 虚拟 前 级 ， 
到 与 实际 的 卫 前 级 对 应 的 路 1 
以 使 核心 路 由 表 缩 小 两 个 数量 级 ， 但 是 路 径 长 度 比 原来 
的 粒度 越 大 ， 路 径 的 拉 伸 度 越 高 ， 因 
似 之 处 。 但 是 CRIO 的 虚拟 前 级 分 配 可 以 与 网 络 拓 扑 无 关 ， 并且 CRIO 将 所 有 的 改变 限制 在 


关联 。 这 些 路 


道 方式 路 


运营 商 网 络 中 。 


器 称 为 聚合 代 百 


器 。 由 于 核心 


此 存 妖 


区 域 使 用 了 虚拟 前 级 ， 


FE 一 个 利 次 平衡 问题 。 


虚拟 前 级 与 核心 区 域 的 路 由 器 
聚合 代理 用 较 短 的 前 级 能 够 涌 合 很 多 较 
并 负责 将 接收 到 的 包 用 隧 


CRIO 方法 可 
的 路 径 有 所 拉 仲 。 实 际 上 ,虚拟 前 绿 


CRIO 与 原子 路 


有 很 多 相 


ISLAY 使 用 的 虚拟 聚集 对 象 称 为 “aggregate”, 相 应 的 标识 称 为 aggregate ID 。 一 个 


aggregate 可 以 聚合 多 个 其 它 aggregate 和 IP 前 级 。 


大 幅 缩小 了 路 由 表 规 模 。 


这 类 路 | 


3.2.3 核心 与 边缘 分 离 


核心 一 边缘 分 离 (core-edge separa- 


tiom) 架 构 的 基本 思想 是 将 提供 商 网 络 ( 即 
转发 网 络 ) 与 边缘 的 客户 网 络 ( 即 stub 网 
的 地 址 和 路 由 空间 隔离 。 这 利 
是 出 者 认为 ， 互 联网 路 由 扩展 问题 的 模 


络 ) 


架构 的 


源 在 于 核心 网 络 和 边缘 网 络 使 用 同一 个 


地 址 和 路 


由 空间 ， 而 核心 网 络 的 地 址 聚 


合 要 求 与 客户 网 络 的 流量 工程 、 多 宿主 


A 
等 反 聚 合 


因素 存在 予 


较 稳 定 ， 


发 的 路 由 更 新 都 要 多 得 多 ， 并 上 
通过 隔离 核心 网 络 和 边缘 网 络 ， 在 
只 维护 核心 网 络 通告 的 I 
昼 缩 小 核心 路 由 表 ， 并 
离 客户 网 络 引 起 的 路 由 更 新 ， 减 
更 新 数量 和 提高 路 由 收敛 属性 。 


快 。 

核心 路 由 器 中 
前 级 ， 可 以 大 
能 够 隔 
少 路 | 


盾 。 核 心 网 络 无 论 
是 在 卫 前 绥 数 量 上 还 是 拓扑 上 者 
而 边缘 网 络 的 卫 前 绥 数 量 和 引 


了 相对 比 


增长 更 


这 方面 的 代表 工作 如 eFitt1。 


eFit 提出 将 IP 地 址 空间 划分 为 两 种 ， 即 提供 商 地 址 和 用 户 地 址 空间 。 前 者 在 核心 网 络 
中 使 用 ， 而 后 者 针对 边缘 网 络 ， 不 能 出 现在 核心 路 由 表 中 ， 但 必须 是 全 局 可 达 的 。 


核心 路 | 


核心 转发 网 络 


边缘 网 络 


< 
> 


*ISP: 网 络 服务 提供 商 


表 中 仅 使 用 aggregate ID， 同 样 


架构 也 需要 建立 和 维护 卫 前 绥 到 虚拟 聚集 对 象 标 识 的 映射 表 ， 并 提供 查询 。 


图 5. 核心 网 络 与 边缘 网 络 隔离 的 路 | 


架构 
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图 5 给 出 
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了 eFit 架构 中 端 到 端的 路 由 过 程 : 源 自 客 户 站 点 的 耳 包 先 使 用 目的 用 户 地 址 路 由 到 提供 商 
网 络 的 入 口 边界 路 由 器 P1; 然后 P1 根 据 用 户 地 址 通过 映射 系统 查询 对 应 的 目的 提供 商 地 址 ， 
即 与 目的 站 点 相连 的 提供 商 网 络 的 边界 路 由 器 的 地 址 ， 设 为 P2; 在 P1 处 将 P2 作为 首部 对 
IP 包 进 行 封 装 ， 将 包 隧 道 至 P2，P2 对 收 到 的 包 进行 拆 封 ,再 使 用 目的 用 户 地 址 路 由 至 目的 
主机 。eFit 对 核心 路 由 表 的 缩减 程度 依赖 于 提供 商 地 址 的 聚合 程度 。 因 此 核心 路 由 表 规 模 大 
体 上 与 提供 商 网 络 数量 呈 线 性 比例 。 


核心 一 边缘 分 离 的 思想 实际 上 在 多 数 路 由 架构 和 提案 中 都 得 到 了 不 同 程度 的 体现 。 不 同 
的 是 ,其它 的 路 由 架构 ， 如 位 置 符 与 标识 符 分 离 等 ， 并 不 严格 要 求 隔离 边缘 和 核心 的 路 由 衬 
间 ， 而 是 允许 路 由 协议 穿越 边界 。 核 心 一 边缘 分 离 方 案 也 需要 一 个 映射 系统 来 建立 和 维护 用 
户 地 址 空间 到 提供 商 地 址 空间 的 映射 ， 并 提供 查询 功能 。 


3.2.4 位 置 符 与 标识 符 分 离 


位 置 符 /标识 符 分 离 (Locator/ID separation) 架 构 的 提出 者 认为 现 有 互联 网 路 由 系统 扩展 
性 差 的 一 个 因素 是 卫 地 址 语义 过 载 ， 即 既 作为 位 置 符 又 作为 标识 符 。 当 卫 地 址 标识 终端 身 
份 时 , 它 是 根据 网 络 服务 提供 商 组 织 结构 而 非 拓扑 结构 分 配 ， 导 致 目前 互联 网 唯一 有 效 的 路 
缩减 技术 一 一 拓扑 聚合 的 失效 。 解 决 方法 是 将 单一 的 IP 地 址 空间 分 离 为 位 置 符 与 标识 符 
两 种 地 址 空间 。 位 置 符 是 基于 拓扑 分 配 的 ， 可 由 提供 商 聚 合 ， 而 标识 符 不 需要 依赖 于 拓扑 ， 
可 以 在 应 用 层 和 传输 层 使 用 。 因 此 ,拓扑 变化 时 标识 符 不 需要 改变 ， 只 需要 改变 相关 的 位 置 
符 。 值 得 说 明 的 是 ， 位 置 符 与 标识 符 分 离 方案 强调 尽 可 能 保持 互联 网 原 有 的 路 由 协议 不 变 ， 
因此 可 部 署 性 相对 较 好 , 是 受到 最 多 关注 的 一 类 路 由 架构 。 最 近 几 年 提出 的 这 类 路 由 架构 和 
IRTF 提案 有 LSIPB0、IvipB2、Six/One RouterB3 等 。 思 科 〈Cisco) 公司 已 经 实现 了 LISP 的 
一 个 原型 系统 。 


位 置 符 和 标识 符 分 离 本 身 并 不 能 提高 路 由 的 扩展 性 ,关键 是 位 置 符 / 标 识 符 分 离 的 位 置 。 
多 数 方案 都 是 在 互联 网 核心 一 边缘 处 分 离 位 置 符 与 标识 符 。 位 置 符 分 配给 核心 网 络 和 边缘 网 
络 的 网 关 ( 路 由 器 )， 而 标识 符 分 配给 客户 网 络 和 终端 设备 。 一 般 在 客户 网 络 本 地 可 以 使 用 标 
识 符 交 付 包 ， 但 是 穿越 核心 网 络 通 常 使 用 隧道 方式 ， 即 在 隧道 入 口 路 由 器 (ITR) 通 过 映射 系 


NN 


全 统 查 询 目的 站 点 的 位 置 符 ， 然 后 使 用 目的 位 置 符 在 核心 网 络 中 路 由 ， 到 达 隧 道 出 口 路 由 器 
二 (ETR)， 然 后 再 使 用 目的 主机 的 标识 符 路 由 。ITR 和 ETR 可 以 放置 在 客户 网 络 中 ， 也 可 以 放 
rr 置 在 提供 商 网 络 中 。 


利用 位 置 符 与 标识 符 分 离 ， 客 户 网 络 完全 可 以 使 用 与 提供 商 无 关 的 IP 地 址 ， 在 改变 提 
供 商 时 不 需要 重新 编号 。 通 过 使 用 与 拓扑 无 关 的 标识 符 ， 这 类 方案 对 客户 网 络 在 流量 工程 、 
多 宿主 和 移动 性 等 方面 的 扩展 性 也 提供 了 良好 的 支持 。 而 对 于 提供 商 网 络 ， 由 于 位 置 符 可 以 
按 基于 提供 商 聚 合 的 方式 分 配 ， 因 此 核心 路 由 表 规 模 能 够 得 到 大 幅 缩 小 。 但 是 提供 商 网 络 的 
流量 工程 将 受到 位 置 符 聚 合 的 约束 。 

3.2.5 支持 源 路 由 的 架构 

这 类 路 由 架构 的 特点 主要 是 在 解决 路 由 扩展 性 问题 的 同时 支持 用 户 源 路 由 选择 和 多 路 
径路 由 。 代 表 工 作 有 NIRAB4 和 Pathlet Routingb5l。 

NIRA 根据 用 户 站 点 到 互联 网 核心 (通常 由 tier-1 自治 系统 构成 ) 或 对 等 连接 点 的 上 行路 
径 来 对 用 户 站 点 编 址 ， 一 条 路 径 用 一 个 地 址 来 编码 ， 这 种 编 址 方式 是 基于 提供 商 聚 合 的 。 
NIRA 主要 是 针对 IPv6 的 ， 但 是 也 可 以 改编 用 于 了 Pv4， 此 时 一 条 上 行路 径 可 以 用 一 串 IPv4 
地 址 来 编码 。 假 设 使 用 IPv6 地 址 ， 那 么 从 源 主机 到 目的 主机 的 一 条 路 径 可 以 通过 它们 的 地 
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互联 网 可 扩展 路 由 研究 


址 来 联合 推出 。 如 图 6 所 示 ， 网 络 N1 的 月 


和 1:2:1::1000， 以 及 从 对 等 连接 点 
分 配 来 的 地 址 FFFF :1 :1::1000。 网 
络 N3 的 用 户 B 具 有 从 核心 网 络 分 配 
来 的 地 址 2:1:1::2000 和 
1 :3 :1::2000， 以 及 从 对 等 连接 点 分 
配 来 的 地 址 FFFF :2 :1::2000。 用 户 
可 以 使 用 源 地 址 和 目的 地 址 来 计算 
一 条 合法 的 路 径 。 如 用 户 A 可 以 使 用 
源 地 址 1:1:1::1000 和 B 的 地 址 
1 :3 :1 ::2000 来 得 到 一 条 路 径 N1 一 
R1 一 B1 一 R3 一 N3， 或 者 用 源 地 址 
FFFF:1:1::1000 和 B 的 地 址 
FFFF :2 :1::2000 得 到 路 径 N1 一 R2 一 
R3 一 N3。 


ra 
mm 
2 


究 


日 户 A 具有 从 核心 网 络 分 配 来 的 地 址 1 :1 :1 ::1000 


— 
pe ~ 
~ /B83 P 
/ 3::/16 4::16/  、 
| T ) 
Bi / 
、~~、\:16 2::/16/ 7 
1:1::/32 7 2:1::/32 
1:2::/3 1:3::/32 
1:1:1::/48 i RFFFF:2::/3 
1:2:1::/48 FFFF:1::/32 2:1:1::/48 
FFFF:1:1::/48(CN1 I N3) 1:3:1::/48 
oh a 
LL 1:1:1::1000 2:1:1::2000 性 
1:2:1::1000 1:3:1::2000 全 


A FFFF:1:1::1000 
图 6. 一 种 支持 用 户 选 择 路 由 的 架构 


Pathlet 路 


的 基本 想法 是 每 个 自治 系统 中 的 路 | 


选择 ， 


制 平面 和 更 多 的 控制 消息 开销 。 
4 总结 与 展望 


虽然 针对 互联 网 的 可 扩展 路 I 
署 。IRTEF 的 路 
成 过 程 
的 事情 ， 


来 需要 


孚 决 的 问题 和 看 


用 需求 ， 例 如 流量 工程 、 


究 方向 进行 了 归纳 ， 分 为 路 
从 路 由 架构 来 看 ， 位 置 符 / 标 识 符 分 离 得 到 了 较 多 的 关注 和 认同 。 

展 问题 外 , 这 种 架构 还 带 来 了 许多 额外 的 好 处 ， 能 够 更 好 地 满足 当前 路 

终端 移动 等 。 但 是 还 存在 以 下 的 问题 : 


这 


研究 取得 了 很 多 成 果 , 但 是 还 没有 
工作 组 还 在 不 断 讨 论 收 到 的 路 由 架构 提案 。 新 的 路 由 解决 方案 还 在 不 断 形 
。 鉴于 互联 网 的 重要 性 和 复杂 性 , 对 现 有 互联 网 路 由 系统 做 出 改变 3 


FFF:2:1::2000 B 


NIRA 


器 聚合 成 一 些 抽象 的 虚拟 节点 vnode， 


治 系统 愿意 提供 的 路 由 线路 就 是 由 一 串 vnode 构成 。 这 样 的 vnode 序列 称 为 pathlet。 每 个 
自治 系统 向 互联 网 发 布 自己 提供 的 pathlets。 源 站 点 可 以 将 连接 源 到 目的 地 的 一 串 首 尾 相 连 
的 pathlets 作为 一 条 端 到 端的 源 路 由 ， 从 而 实现 多 路 径路 


。 这 个 框架 提供 了 比较 灵活 的 路 


两 种 路 


因为 vnodes 能 够 以 任意 的 粒度 来 抽象 网 络 ，pathlets 能 够 表达 路 由 的 约束 策略 ， 同 
时 提供 了 大 量 可 选 的 路 径 ， 从 而 使 得 源 站 点 能 够 按 指 数 级 的 组 合 方式 缝合 pathlets， 形 成 端 
到 端 路 由 。Pathlet 路 由 结合 了 BGP 和 源 路 由 i 


策略 的 优点 ， 其 代价 是 更 复杂 的 控 


种 方案 得 到 应 用 和 部 


不 是 一 件 容易 


有 很 多 问题 需要 考虑 和 解决 。 在 已 有 的 互联 


网 可 扩展 路 由 下 


架构 和 路 由 算法 两 个 方面 。 


究 的 基础 上 ， 我 们 对 未 


(1). 


位 置 符 / 标 识 符 分 离 是 否 真正 最 好 的 路 | 


术 , 创建 


(2). 位 置 符 /标识 符 分 离 架 构 


的 一 个 研究 热点 ; 


(3). 位 置 符 /标识 


一 个 全 然 不 同 的 网 络 。 然 而 隧 
至 会 因为 传送 数据 过 大 而 天 失 数 据 。 


符 分 离 架 构 中 ， 包 封装 方 光 


日 和 
上 本 o 


是 否 真 正 优 于 地 址 重 写 方法 ， 还 需要 研究 和 评 


除了 可 以 解决 路 由 扩 
| 架构 无 法 支持 的 应 


架构 ? 位 置 符 /标识 符 分 离 方案 依赖 于 隧道 技 
道 技术 增加 了 开销 并 提高 了 网 络 延 迟 ， 有 时 其 
因此 仍 有 必要 继续 探索 新 的 更 好 的 路 由 解决 方案 ; 
， 如 何 构建 最 好 的 映射 系统 ? 欧 射 系统 必须 具有 高 扩展 、 安 全 
性 和 低 延 迟 等 性 质 。 了 上 映 射 系 统 设计 涉及 :映射 表 建 立 机 制 ， 映 射 表 项 更 新 、 撤 销 机 制 ， 
映射 表 查 询 方 法 ,映射 表 服务 器 的 部 署 、 管 型 


如 何 设计 和 评估 映射 系统 仍 将 是 未 来 
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佑 ; 


(4)， 如 何平 衡 路 由 表 扩 展 性 和 
位 置 符 的 聚合 来 缩减 路 | 然 


期 信息 技术 快报 Vol.8 No.3 
Information Technology Letter May 2010 


Ea 
也 


人 
量 工程 要 求 使 用 更 细 的 地 址 前 绥 ,， 如 何 达到 最 好 的 


上 
se 
二 
| 


平衡 还 需要 研究 ; 


(5). 对 映射 系统 引入 的 利益 关系 ， 即 谁 付 费 、 谁 受益 还 需要 有 更 深入 的 理解 。 比 如 映射 系统 


谁 来 部 署 ， 是 否 需 要 向 用 户 收 费 等 。 


另 一 方面 ,面向 未 来 互联 网 的 可 扩展 路 由 理论 仍然 值得 进一步 研究 。 这 方面 的 工作 目前 
聚焦 在 寻求 比 地 址 聚合 更 好 的 可 扩展 路 由 算法 ， 如 紧凑 路 由 、 贪 心路 由 等 。 地 址 聚合 是 当前 


互联 网 唯一 


使 用 的 可 扩展 路 由 机 制 。 然 而 互联 网 自治 系统 级 拓扑 结构 逐渐 从 树 状 演化 成 网 状 


Cmesh)， 呈 现 无 标 度 特征 。 一 些 专家 认为 ， 地 址 聚合 在 本 质 上 越 来 越 与 域 间 拓扑 结构 背离 ， 


故 从 长 期 来 看 ,扩展 性 将 受到 限 和 


一 


* 因此 有 必要 充分 竹 层 联网 的 结构 和 演化 特性 来 设计 高 


效 的 路 由 算法 ， 为 新 的 可 扩展 路 由 方案 提供 理论 与 实践 指导 。 


参考 文献 : 


[1] 


[2] 
[3] 
[4] 


[5] 


[6] 


[7] 


[8] 


[9] 


[10] 


[11] 


[12] 


[13] 


[14] 


[15] 


[16] 
[17] 


Meyer D, Zhang L, Fall K, Report from the IAB workshop on routing and addressing, The Internet 
Architecture Board, 2007. 


BGP Routing Table Analysis Reports, http://bgp.potaroo.net/. 
Karpilovsky E and Rexford J, Using forgetful routing to control BGP table size, In CoNEXT, 2006. 


Kleinrock L, Kamoun F, Hierarchical routing for large networks: Performance evaluation and 
optimization, Computer Networks, 1:155-174, 1977. 


Massey D, Wang L, Zhang B, and Zhang L, A proposal for scalable Internet routing and addressing, 
Internet Draft, http:/www.ietf.org/internet-drafts/draft-wang- ietf-efit-00.txt, 2007, 2. 
Tsuchiya P, The landmark hierarchy: A new hierarchy for routing in very large networks, In 


Proceedings of ACM SIGCOMM, 1988. 


Stoica I, Morris R, Karger D, Kaashoek MEF, and Balakrishnan H, Chord: A scalable peer-to-peer 
lookup service for internet applications, In Proceedings of ACM SIGCOMM, San Diego, California, 
August 2001. 


Plaxton CG, Rajaraman R, Richa AW, Accessing nearby copies of replicated objects in a distributed 
environment, In Proceedings of the ninth annual ACM symposium on Parallel algorithms and 
architectures, pages 311-320, Newport, Rhode Island, United States, 1997. 


Caesar M, Castro M, Nightingale E, O’Shea G, Rowstron A, Virtual ring routing: network routing 
inspired by DHTs, In Proceedings of ACM SIGCOMM, 2006. 


Caesar M, Condie T, Kannan J, Lakshminarayanan K, Stoica 1, and Shenker S, ROFL: Routing on 
flat labels, In Proceedings of ACM SIGCOMM, 2006. 


Thorup M, Zwick U, Compact routing schemes, In Proceedings of the 13th ACM Symposium on 
Parallel Algorithms and Architecture (SPAA 2001), Heraklion :ACM Press, 2001,1-10. 


Abraham 1, Gavoille C, Malkhi D, Nisan N, and Thorup M, Compact name-independent routing with 
minimum stretch, In SPAA, 2004. 


Krioukov D, Fall K, Yang X, Compact routing on Internet-like graphs, In Proceedings of INFOCOM, 
Hong Kong IEEE, 2004, 209-219. 


Enachescu M,Wang M,Goel A, Reducing maximum stretch in compact routing, In Proceedings of 
INFOCOM, Phoenix:IEEE, 2008, 977-985. 


Brady A, Cowen L, Compact routing on power-law graphs with additive stretch, In Proc. of the 8th 
Workshop on Algorithm Engineering and Experiments, 2006, 119-128. 


唐 明 董 , 张 国 清 , 杨 景 ,张国强 ,针对 无 标 度 网 络 的 紧凑 路 由 方法 ，《 软 件 学 报 》， 已 录用 待 发 表 . 
Krioukov D, Fall K, Brady A, On compact routing for the Internet, ACM SIGCOMM Computer 


49 


[18] 


[19] 


[20] 


[21] 


[22] 


[23] 


[24] 


[25] 


[26] 


[27] 


[28] 


[29] 


[30] 
[31] 


[32] 


[33] 


[34] 


[35] 


作者 简介 : 


唐 明 董 : 


张 国 清 : 
杨 景 : 


张国强 : 


互联 网 可 扩展 路 由 


Communication Review, 2007(7), 37:43-52. 


Karp B and Kung H.T., GPSR: greedy perimeter stateless routing for wireless networks, In Proceed- 
ings of the 6th Annual MOBICOM, ACM Press, 2000, pp. 243-254. 


Francis P Comparison of geographical and provider-rooted Internet addressing, Computer Networks 
and ISDN Systems, 27(3):437-448, 1994. 


Hain T, An IPv6 provider-independent global unicast address format, Internet Draft, 
http://tools.ietf.org/html/draft- hain-ipv6-pi-addr-10, 2006. 


Oliveira R, Lad M, Zhang B, Zhang L, Geographically informed inter-Domain routing, ICNP, 2007. 


Fonseca R, Ratnasamy S, Zhao J, Ee CT Culler D, Shenker S and Stoica I, Beacon vector routing: 
Scalable point to point routing in wireless sensornets, In Proceedings of the Second USENIX/ACM 
Syposium on Networked Systems Design and Implementation (NSDI 2005), 2005. 


Kleinberg R, Geographic routing using hyperbolic space, In Proc. IEEE INFOCOM, 2007. 


Flury R, Pemmaraju S, and Wattenhofer R, Greedy routing with bounded stretch, In Proc. IEEE 
INFOCOM, 2009. 


Krioukov D, Papadopoulos F, Boguna M, and Vahdat A, Greedy forwarding in scale-free networks 
embedded in hyperbolic metric spaces, ACM SIGMETRICS Performance Evaluation Review, Vol. 37, 
no.2, p15-17, 2009. 


唐 明 董 , 张 国清 , 杨 景 ,大 规模 网 络 上 基于 图 坎 入 的 可 扩展 路 由 方法 研究 , 《计算 机 研究 与 发 展 》， 
已 录用 待 发 表 . 

Subramanian L, Caesar M, Ee C.T., Handley M, Mao M, Shenker S, Stoica I, HLP: A next-generation 
Interdomain routing protocol, In Proceedings of ACM SIGCOMM, August 2005. 


Verkaik P, Broido A, claffy kc, Gao R, Hyun Y Ronald van der Pol, Beyond CIDR aggregation. 
Technical Report TR-2004-1,CAIDA, 2004. 


ul 


Zhang X, Francis P, Wang J and Yoshida K, Scaling IP routing with the core router-integrated overlay, 
IEEE International Conference on Network Protocols (ICNP), 2006. 


Kastenholz F, ISLAY:A new routing and addressing architecture, IRTF, Internet Draft, 2002. 


Farinacci D, Fuller V, Oran D, and Meyer D, Locator/ID Separation Protocol(LISP), Internet Draft, 
http:/www.ietf.org/internet-drafts/draft-farinacci-lisp-05.txt, 2007. 


Whittle, R, Ivip (Internet Vastly Improved Plumbing) Architecture, Internet Draft, Work in Progress, 
draft-whittle-ivip-arch-01 .txt. 


Vogt C, Six/One Router: A scalable and backwards-compatible solution for provider-independent 
addressing, In ACM SIGCOMM MobiArch Workshop, 2008. 


Yang X, Clark D, Berger AW, NIRA: A new inter-domain routing architecture, IEEE/ACM 
TRANSACTIONS ON NETWORKING, VOL. 15, NO. 4, AUGUST 2007. 


Godfrey PB, Ganichev I, Shenker S, Stoica I, Pathlet routing, In Proceedings of SIGCOMM, Aug. 
2009. 


中 国 科 学 院 计算 技术 研究 所 博士 生 ， 湖 南 科 技 大 学 计算 机 学 院 讲 师 ，Email: 
tangmingdong@ict.ac.cn 
博士 ， 中 国 科学 院 计 算 技术 研究 所 副 研究 员 ， 硕 士 生 导师 
博士 ， 中 国 移动 研究 院 首 证 科学 家 ， 中 国 科 学 院 计 算 技 术 研 究 所 客座 研究 员 ， 


博士 ， 中 国 科学 院 计算 技术 研究 所 助 型 


二 1 
S 
妇 


50 


